Model Selection

Multi-reward Reinforcement Learning

# Multi-reward Reinforcement Learning

Qwen GLOCON Reasoning

A reinforcement learning model based on Qwen2.5-3B-Instruct, specifically designed for conflict event classification, optimized using the GRPO method for multi-reward signals and structured reasoning formats.

Large Language Model English

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase